home *** CD-ROM | disk | FTP | other *** search
/ Celestin Apprentice 5 / Apprentice-Release5.iso / Source Code / C / Applications / Moscow ML 1.31 / source code / mosml / src / mosmlyac / reader.c < prev    next >
Encoding:
C/C++ Source or Header  |  1996-07-03  |  30.6 KB  |  1,759 lines  |  [TEXT/R*ch]

  1. #include "defs.h"
  2.  
  3. /*  The line size must be a positive integer.  One hundred was chosen    */
  4. /*  because few lines in Yacc input grammars exceed 100 characters.    */
  5. /*  Note that if a line exceeds LINESIZE characters, the line buffer    */
  6. /*  will be expanded to accomodate it.                    */
  7.  
  8. #define LINESIZE 100
  9.  
  10. char *cache;
  11. int cinc, cache_size;
  12.  
  13. int ntags, tagmax;
  14. char **tag_table;
  15.  
  16. char saw_eof, unionized;
  17. char *cptr, *line;
  18. int linesize;
  19.  
  20. bucket *goal;
  21. int prec;
  22. int gensym;
  23. char last_was_action;
  24.  
  25. int maxitems;
  26. bucket **pitem;
  27.  
  28. int maxrules;
  29. bucket **plhs;
  30.  
  31. int name_pool_size;
  32. char *name_pool;
  33.  
  34. char line_format[] = "(* Line %d, file %s *)\n";
  35.  
  36.  
  37. cachec(c)
  38. int c;
  39. {
  40.     assert(cinc >= 0);
  41.     if (cinc >= cache_size)
  42.     {
  43.     cache_size += 256;
  44.     cache = REALLOC(cache, cache_size);
  45.     if (cache == 0) no_space();
  46.     }
  47.     cache[cinc] = c;
  48.     ++cinc;
  49. }
  50.  
  51.  
  52. get_line()
  53. {
  54.     register FILE *f = input_file;
  55.     register int c;
  56.     register int i;
  57.  
  58.     if (saw_eof || (c = getc(f)) == EOF)
  59.     {
  60.     if (line) { FREE(line); line = 0; }
  61.     cptr = 0;
  62.     saw_eof = 1;
  63.     return;
  64.     }
  65.  
  66.     if (line == 0 || linesize != (LINESIZE + 1))
  67.     {
  68.     if (line) FREE(line);
  69.     linesize = LINESIZE + 1;
  70.     line = MALLOC(linesize);
  71.     if (line == 0) no_space();
  72.     }
  73.  
  74.     i = 0;
  75.     ++lineno;
  76.     for (;;)
  77.     {
  78.     line[i]  =  c;
  79.     if (c == '\n') { cptr = line; return; }
  80.     if (++i >= linesize)
  81.     {
  82.         linesize += LINESIZE;
  83.         line = REALLOC(line, linesize);
  84.         if (line ==  0) no_space();
  85.     }
  86.     c = getc(f);
  87.     if (c ==  EOF)
  88.     {
  89.         line[i] = '\n';
  90.         saw_eof = 1;
  91.         cptr = line;
  92.         return;
  93.     }
  94.     }
  95. }
  96.  
  97.  
  98. char *
  99. dup_line()
  100. {
  101.     register char *p, *s, *t;
  102.  
  103.     if (line == 0) return (0);
  104.     s = line;
  105.     while (*s != '\n') ++s;
  106.     p = MALLOC(s - line + 1);
  107.     if (p == 0) no_space();
  108.  
  109.     s = line;
  110.     t = p;
  111.     while ((*t++ = *s++) != '\n') continue;
  112.     return (p);
  113. }
  114.  
  115.  
  116. skip_comment()
  117. {
  118.     register char *s;
  119.  
  120.     int st_lineno = lineno;
  121.     char *st_line = dup_line();
  122.     char *st_cptr = st_line + (cptr - line);
  123.  
  124.     s = cptr + 2;
  125.     for (;;)
  126.     {
  127.     if (*s == '*' && s[1] == '/')
  128.     {
  129.         cptr = s + 2;
  130.         FREE(st_line);
  131.         return;
  132.     }
  133.     if (*s == '\n')
  134.     {
  135.         get_line();
  136.         if (line == 0)
  137.         unterminated_comment(st_lineno, st_line, st_cptr);
  138.         s = cptr;
  139.     }
  140.     else
  141.         ++s;
  142.     }
  143. }
  144.  
  145.  
  146. int
  147. nextc()
  148. {
  149.     register char *s;
  150.  
  151.     if (line == 0)
  152.     {
  153.     get_line();
  154.     if (line == 0)
  155.         return (EOF);
  156.     }
  157.  
  158.     s = cptr;
  159.     for (;;)
  160.     {
  161.     switch (*s)
  162.     {
  163.     case '\n':
  164.         get_line();
  165.         if (line == 0) return (EOF);
  166.         s = cptr;
  167.         break;
  168.  
  169.     case ' ':
  170.     case '\t':
  171.     case '\f':
  172.     case '\r':
  173.     case '\v':
  174.     case ',':
  175.     case ';':
  176.         ++s;
  177.         break;
  178.  
  179.     case '\\':
  180.         cptr = s;
  181.         return ('%');
  182.  
  183.     case '/':
  184.         if (s[1] == '*')
  185.         {
  186.         cptr = s;
  187.         skip_comment();
  188.         s = cptr;
  189.         break;
  190.         }
  191.         else if (s[1] == '/')
  192.         {
  193.         get_line();
  194.         if (line == 0) return (EOF);
  195.         s = cptr;
  196.         break;
  197.         }
  198.         /* fall through */
  199.  
  200.     default:
  201.         cptr = s;
  202.         return (*s);
  203.     }
  204.     }
  205. }
  206.  
  207.  
  208. int
  209. keyword()
  210. {
  211.     register int c;
  212.     char *t_cptr = cptr;
  213.  
  214.     c = *++cptr;
  215.     if (isalpha(c))
  216.     {
  217.     cinc = 0;
  218.     for (;;)
  219.     {
  220.         if (isalpha(c))
  221.         {
  222.         if (isupper(c)) c = tolower(c);
  223.         cachec(c);
  224.         }
  225.         else if (isdigit(c) || c == '_' || c == '.' || c == '$')
  226.         cachec(c);
  227.         else
  228.         break;
  229.         c = *++cptr;
  230.     }
  231.     cachec(NUL);
  232.  
  233.     if (strcmp(cache, "token") == 0 || strcmp(cache, "term") == 0)
  234.         return (TOKEN);
  235.     if (strcmp(cache, "type") == 0)
  236.         return (TYPE);
  237.     if (strcmp(cache, "left") == 0)
  238.         return (LEFT);
  239.     if (strcmp(cache, "right") == 0)
  240.         return (RIGHT);
  241.     if (strcmp(cache, "nonassoc") == 0 || strcmp(cache, "binary") == 0)
  242.         return (NONASSOC);
  243.     if (strcmp(cache, "start") == 0)
  244.         return (START);
  245.     if (strcmp(cache, "union") == 0)
  246.         return (UNION);
  247.     if (strcmp(cache, "ident") == 0)
  248.         return (IDENT);
  249.     }
  250.     else
  251.     {
  252.     ++cptr;
  253.     if (c == '{')
  254.         return (TEXT);
  255.     if (c == '%' || c == '\\')
  256.         return (MARK);
  257.     if (c == '<')
  258.         return (LEFT);
  259.     if (c == '>')
  260.         return (RIGHT);
  261.     if (c == '0')
  262.         return (TOKEN);
  263.     if (c == '2')
  264.         return (NONASSOC);
  265.     }
  266.     syntax_error(lineno, line, t_cptr);
  267.     /*NOTREACHED*/
  268. }
  269.  
  270.  
  271. copy_ident()
  272. {
  273.     register int c;
  274.     register FILE *f = output_file;
  275.  
  276.     c = nextc();
  277.     if (c == EOF) unexpected_EOF();
  278.     if (c != '"') syntax_error(lineno, line, cptr);
  279.     ++outline;
  280.     fprintf(f, "#ident \"");
  281.     for (;;)
  282.     {
  283.     c = *++cptr;
  284.     if (c == '\n')
  285.     {
  286.         fprintf(f, "\"\n");
  287.         return;
  288.     }
  289.     putc(c, f);
  290.     if (c == '"')
  291.     {
  292.         putc('\n', f);
  293.         ++cptr;
  294.         return;
  295.     }
  296.     }
  297. }
  298.  
  299.  
  300. copy_text()
  301. {
  302.     register int c;
  303.     int quote;
  304.     register FILE *f = text_file;
  305.     int need_newline = 0;
  306.     int t_lineno = lineno;
  307.     char *t_line = dup_line();
  308.     char *t_cptr = t_line + (cptr - line - 2);
  309.  
  310.     if (*cptr == '\n')
  311.     {
  312.     get_line();
  313.     if (line == 0)
  314.         unterminated_text(t_lineno, t_line, t_cptr);
  315.     }
  316.  
  317. loop:
  318.     c = *cptr++;
  319.     switch (c)
  320.     {
  321.     case '\n':
  322.     next_line:
  323.     putc('\n', f);
  324.     need_newline = 0;
  325.     get_line();
  326.     if (line) goto loop;
  327.     unterminated_text(t_lineno, t_line, t_cptr);
  328.  
  329.     case '`':
  330.     case '"':
  331.     {
  332.         int s_lineno = lineno;
  333.         char *s_line = dup_line();
  334.         char *s_cptr = s_line + (cptr - line - 1);
  335.  
  336.         quote = c;
  337.         putc(c, f);
  338.         for (;;)
  339.         {
  340.         c = *cptr++;
  341.         putc(c, f);
  342.         if (c == quote)
  343.         {
  344.             need_newline = 1;
  345.             FREE(s_line);
  346.             goto loop;
  347.         }
  348.         if (c == '\n')
  349.             unterminated_string(s_lineno, s_line, s_cptr);
  350.         if (c == '\\')
  351.         {
  352.             c = *cptr++;
  353.             putc(c, f);
  354.             if (c == '\n')
  355.             {
  356.             get_line();
  357.             if (line == 0)
  358.                 unterminated_string(s_lineno, s_line, s_cptr);
  359.             }
  360.         }
  361.         }
  362.     }
  363.  
  364.     case '(':
  365.     putc(c, f);
  366.     need_newline = 1;
  367.     c = *cptr;
  368.     if (c == '*')
  369.     {
  370.         int c_lineno = lineno;
  371.         char *c_line = dup_line();
  372.         char *c_cptr = c_line + (cptr - line - 1);
  373.  
  374.         putc('*', f);
  375.         ++cptr;
  376.         for (;;)
  377.         {
  378.         c = *cptr++;
  379.         putc(c, f);
  380.         if (c == '*' && *cptr == ')')
  381.         {
  382.             putc(')', f);
  383.             ++cptr;
  384.             FREE(c_line);
  385.             goto loop;
  386.         }
  387.         if (c == '\n')
  388.         {
  389.             get_line();
  390.             if (line == 0)
  391.             unterminated_comment(c_lineno, c_line, c_cptr);
  392.         }
  393.         }
  394.     }
  395.     need_newline = 1;
  396.     goto loop;
  397.  
  398.     case '%':
  399.     case '\\':
  400.     if (*cptr == '}')
  401.     {
  402.         if (need_newline) putc('\n', f);
  403.         ++cptr;
  404.         FREE(t_line);
  405.         return;
  406.     }
  407.     /* fall through */
  408.  
  409.     default:
  410.     putc(c, f);
  411.     need_newline = 1;
  412.     goto loop;
  413.     }
  414. }
  415.  
  416.  
  417. copy_union()
  418. {
  419.     register int c;
  420.     int quote;
  421.     int depth;
  422.     int u_lineno = lineno;
  423.     char *u_line = dup_line();
  424.     char *u_cptr = u_line + (cptr - line - 6);
  425.  
  426.     if (unionized) over_unionized(cptr - 6);
  427.     unionized = 1;
  428.  
  429.     if (!lflag)
  430.     fprintf(text_file, line_format, lineno, input_file_name);
  431.  
  432.     fprintf(text_file, "typedef union");
  433.     if (dflag) fprintf(union_file, "typedef union");
  434.  
  435.     depth = 1;
  436.     cptr++;
  437.  
  438. loop:
  439.     c = *cptr++;
  440.     putc(c, text_file);
  441.     if (dflag) putc(c, union_file);
  442.     switch (c)
  443.     {
  444.     case '\n':
  445.     next_line:
  446.     get_line();
  447.     if (line == 0) unterminated_union(u_lineno, u_line, u_cptr);
  448.     goto loop;
  449.  
  450.     case '{':
  451.     ++depth;
  452.     goto loop;
  453.  
  454.     case '}':
  455.         --depth;
  456.         if (c == '}' && depth == 0) {
  457.           fprintf(text_file, " YYSTYPE;\n");
  458.           FREE(u_line);
  459.           return;
  460.         }
  461.         goto loop;
  462.  
  463.     case '\'':
  464.     case '"':
  465.     {
  466.         int s_lineno = lineno;
  467.         char *s_line = dup_line();
  468.         char *s_cptr = s_line + (cptr - line - 1);
  469.  
  470.         quote = c;
  471.         for (;;)
  472.         {
  473.         c = *cptr++;
  474.         putc(c, text_file);
  475.         if (dflag) putc(c, union_file);
  476.         if (c == quote)
  477.         {
  478.             FREE(s_line);
  479.             goto loop;
  480.         }
  481.         if (c == '\n')
  482.             unterminated_string(s_lineno, s_line, s_cptr);
  483.         if (c == '\\')
  484.         {
  485.             c = *cptr++;
  486.             putc(c, text_file);
  487.             if (dflag) putc(c, union_file);
  488.             if (c == '\n')
  489.             {
  490.             get_line();
  491.             if (line == 0)
  492.                 unterminated_string(s_lineno, s_line, s_cptr);
  493.             }
  494.         }
  495.         }
  496.     }
  497.  
  498.     case '(':
  499.     c = *cptr;
  500.     if (c == '*')
  501.     {
  502.         int c_lineno = lineno;
  503.         char *c_line = dup_line();
  504.         char *c_cptr = c_line + (cptr - line - 1);
  505.  
  506.         putc('*', text_file);
  507.         if (dflag) putc('*', union_file);
  508.         ++cptr;
  509.         for (;;)
  510.         {
  511.         c = *cptr++;
  512.         putc(c, text_file);
  513.         if (dflag) putc(c, union_file);
  514.         if (c == '*' && *cptr == ')')
  515.         {
  516.             putc(')', text_file);
  517.             if (dflag) putc(')', union_file);
  518.             ++cptr;
  519.             FREE(c_line);
  520.             goto loop;
  521.         }
  522.         if (c == '\n')
  523.         {
  524.             get_line();
  525.             if (line == 0)
  526.             unterminated_comment(c_lineno, c_line, c_cptr);
  527.         }
  528.         }
  529.     }
  530.     goto loop;
  531.  
  532.     default:
  533.     goto loop;
  534.     }
  535. }
  536.  
  537.  
  538. int
  539. hexval(c)
  540. int c;
  541. {
  542.     if (c >= '0' && c <= '9')
  543.     return (c - '0');
  544.     if (c >= 'A' && c <= 'F')
  545.     return (c - 'A' + 10);
  546.     if (c >= 'a' && c <= 'f')
  547.     return (c - 'a' + 10);
  548.     return (-1);
  549. }
  550.  
  551.  
  552. bucket *
  553. get_literal()
  554. {
  555.     register int c, quote;
  556.     register int i;
  557.     register int n;
  558.     register char *s;
  559.     register bucket *bp;
  560.     int s_lineno = lineno;
  561.     char *s_line = dup_line();
  562.     char *s_cptr = s_line + (cptr - line);
  563.  
  564.     quote = *cptr++;
  565.     cinc = 0;
  566.     for (;;)
  567.     {
  568.     c = *cptr++;
  569.     if (c == quote) break;
  570.     if (c == '\n') unterminated_string(s_lineno, s_line, s_cptr);
  571.     if (c == '\\')
  572.     {
  573.         char *c_cptr = cptr - 1;
  574.  
  575.         c = *cptr++;
  576.         switch (c)
  577.         {
  578.         case '\n':
  579.         get_line();
  580.         if (line == 0) unterminated_string(s_lineno, s_line, s_cptr);
  581.         continue;
  582.  
  583.         case '0': case '1': case '2': case '3':
  584.         case '4': case '5': case '6': case '7':
  585.         n = c - '0';
  586.         c = *cptr;
  587.         if (IS_OCTAL(c))
  588.         {
  589.             n = (n << 3) + (c - '0');
  590.             c = *++cptr;
  591.             if (IS_OCTAL(c))
  592.             {
  593.             n = (n << 3) + (c - '0');
  594.             ++cptr;
  595.             }
  596.         }
  597.         if (n > MAXCHAR) illegal_character(c_cptr);
  598.         c = n;
  599.             break;
  600.  
  601.         case 'x':
  602.         c = *cptr++;
  603.         n = hexval(c);
  604.         if (n < 0 || n >= 16)
  605.             illegal_character(c_cptr);
  606.         for (;;)
  607.         {
  608.             c = *cptr;
  609.             i = hexval(c);
  610.             if (i < 0 || i >= 16) break;
  611.             ++cptr;
  612.             n = (n << 4) + i;
  613.             if (n > MAXCHAR) illegal_character(c_cptr);
  614.         }
  615.         c = n;
  616.         break;
  617.  
  618.         case 'a': c = 7; break;
  619.         case 'b': c = '\b'; break;
  620.         case 'f': c = '\f'; break;
  621.         case 'n': c = '\n'; break;
  622.         case 'r': c = '\r'; break;
  623.         case 't': c = '\t'; break;
  624.         case 'v': c = '\v'; break;
  625.         }
  626.     }
  627.     cachec(c);
  628.     }
  629.     FREE(s_line);
  630.  
  631.     n = cinc;
  632.     s = MALLOC(n);
  633.     if (s == 0) no_space();
  634.  
  635.     for (i = 0; i < n; ++i)
  636.     s[i] = cache[i];
  637.  
  638.     cinc = 0;
  639.     if (n == 1)
  640.     cachec('\'');
  641.     else
  642.     cachec('"');
  643.  
  644.     for (i = 0; i < n; ++i)
  645.     {
  646.     c = ((unsigned char *)s)[i];
  647.     if (c == '\\' || c == cache[0])
  648.     {
  649.         cachec('\\');
  650.         cachec(c);
  651.     }
  652.     else if (isprint(c))
  653.         cachec(c);
  654.     else
  655.     {
  656.         cachec('\\');
  657.         switch (c)
  658.         {
  659.         case 7: cachec('a'); break;
  660.         case '\b': cachec('b'); break;
  661.         case '\f': cachec('f'); break;
  662.         case '\n': cachec('n'); break;
  663.         case '\r': cachec('r'); break;
  664.         case '\t': cachec('t'); break;
  665.         case '\v': cachec('v'); break;
  666.         default:
  667.         cachec(((c >> 6) & 7) + '0');
  668.         cachec(((c >> 3) & 7) + '0');
  669.         cachec((c & 7) + '0');
  670.         break;
  671.         }
  672.     }
  673.     }
  674.  
  675.     if (n == 1)
  676.     cachec('\'');
  677.     else
  678.     cachec('"');
  679.  
  680.     cachec(NUL);
  681.     bp = lookup(cache);
  682.     bp->class = TERM;
  683.     if (n == 1 && bp->value == UNDEFINED)
  684.     bp->value = *(unsigned char *)s;
  685.     FREE(s);
  686.  
  687.     return (bp);
  688. }
  689.  
  690.  
  691. int
  692. is_reserved(name)
  693. char *name;
  694. {
  695.     char *s;
  696.  
  697.     if (strcmp(name, ".") == 0 ||
  698.         strcmp(name, "$accept") == 0 ||
  699.         strcmp(name, "$end") == 0)
  700.     return (1);
  701.  
  702.     if (name[0] == '$' && name[1] == '$' && isdigit(name[2]))
  703.     {
  704.     s = name + 3;
  705.     while (isdigit(*s)) ++s;
  706.     if (*s == NUL) return (1);
  707.     }
  708.  
  709.     return (0);
  710. }
  711.  
  712.  
  713. bucket *
  714. get_name()
  715. {
  716.     register int c;
  717.  
  718.     cinc = 0;
  719.     for (c = *cptr; IS_IDENT(c); c = *++cptr)
  720.     cachec(c);
  721.     cachec(NUL);
  722.  
  723.     if (is_reserved(cache)) used_reserved(cache);
  724.  
  725.     return (lookup(cache));
  726. }
  727.  
  728.  
  729. int
  730. get_number()
  731. {
  732.     register int c;
  733.     register int n;
  734.  
  735.     n = 0;
  736.     for (c = *cptr; isdigit(c); c = *++cptr)
  737.     n = 10*n + (c - '0');
  738.  
  739.     return (n);
  740. }
  741.  
  742.  
  743. char *
  744. get_tag()
  745. {
  746.     register int c;
  747.     register int i;
  748.     register char *s;
  749.     int t_lineno = lineno;
  750.     char *t_line = dup_line();
  751.     char *t_cptr = t_line + (cptr - line);
  752.  
  753.     cinc = 0;
  754.     while (1) {
  755.       c = *++cptr;
  756.       if (c == EOF) unexpected_EOF();
  757.       if (c == '>') break;
  758.       cachec(c);
  759.     }
  760.     ++cptr;
  761.     cachec(NUL);
  762.  
  763.     for (i = 0; i < ntags; ++i)
  764.     {
  765.     if (strcmp(cache, tag_table[i]) == 0)
  766.         return (tag_table[i]);
  767.     }
  768.  
  769.     if (ntags >= tagmax)
  770.     {
  771.     tagmax += 16;
  772.     tag_table = (char **)
  773.             (tag_table ? REALLOC(tag_table, tagmax*sizeof(char *))
  774.                    : MALLOC(tagmax*sizeof(char *)));
  775.     if (tag_table == 0) no_space();
  776.     }
  777.  
  778.     s = MALLOC(cinc);
  779.     if  (s == 0) no_space();
  780.     strcpy(s, cache);
  781.     tag_table[ntags] = s;
  782.     ++ntags;
  783.     FREE(t_line);
  784.     return (s);
  785. }
  786.  
  787.  
  788. declare_tokens(assoc)
  789. int assoc;
  790. {
  791.     register int c;
  792.     register bucket *bp;
  793.     int value;
  794.     char *tag = 0;
  795.  
  796.     if (assoc != TOKEN) ++prec;
  797.  
  798.     c = nextc();
  799.     if (c == EOF) unexpected_EOF();
  800.     if (c == '<')
  801.     {
  802.     tag = get_tag();
  803.     c = nextc();
  804.     if (c == EOF) unexpected_EOF();
  805.     }
  806.  
  807.     for (;;)
  808.     {
  809.     if (isalpha(c) || c == '_' || c == '.' || c == '$')
  810.         bp = get_name();
  811.     else if (c == '\'' || c == '"')
  812.         bp = get_literal();
  813.     else
  814.         return;
  815.  
  816.     if (bp == goal) tokenized_start(bp->name);
  817.     bp->class = TERM;
  818.  
  819.     if (tag)
  820.     {
  821.         if (bp->tag && tag != bp->tag)
  822.         retyped_warning(bp->name);
  823.         bp->tag = tag;
  824.     }
  825.  
  826.     if (assoc == TOKEN)
  827.         {
  828.             bp->true_token = 1;
  829.         }
  830.         else
  831.     {
  832.         if (bp->prec && prec != bp->prec)
  833.         reprec_warning(bp->name);
  834.         bp->assoc = assoc;
  835.         bp->prec = prec;
  836.     }
  837.  
  838.  
  839.     c = nextc();
  840.     if (c == EOF) unexpected_EOF();
  841.     value = UNDEFINED;
  842.     if (isdigit(c))
  843.     {
  844.         value = get_number();
  845.         if (bp->value != UNDEFINED && value != bp->value)
  846.         revalued_warning(bp->name);
  847.         bp->value = value;
  848.         c = nextc();
  849.         if (c == EOF) unexpected_EOF();
  850.     }
  851.     }
  852. }
  853.  
  854.  
  855. declare_types()
  856. {
  857.     register int c;
  858.     register bucket *bp;
  859.     char *tag;
  860.  
  861.     c = nextc();
  862.     if (c == EOF) unexpected_EOF();
  863.     if (c != '<') syntax_error(lineno, line, cptr);
  864.     tag = get_tag();
  865.  
  866.     for (;;)
  867.     {
  868.     c = nextc();
  869.     if (isalpha(c) || c == '_' || c == '.' || c == '$')
  870.         bp = get_name();
  871.     else if (c == '\'' || c == '"')
  872.         bp = get_literal();
  873.     else
  874.         return;
  875.  
  876.     if (bp->tag && tag != bp->tag)
  877.         retyped_warning(bp->name);
  878.     bp->tag = tag;
  879.     }
  880. }
  881.  
  882.  
  883. declare_start()
  884. {
  885.     register int c;
  886.     register bucket *bp;
  887.     static int entry_counter = 0;
  888.  
  889.     c = nextc();
  890.     if (c == EOF) unexpected_EOF();
  891.     if (!isalpha(c) && c != '_' && c != '.' && c != '$')
  892.     syntax_error(lineno, line, cptr);
  893.     bp = get_name();
  894.  
  895.     if (bp->class == TERM)
  896.     terminal_start(bp->name);
  897.     bp->entry = ++entry_counter;
  898.     if (entry_counter == 256)
  899.       too_many_entries();
  900. }
  901.  
  902.  
  903. read_declarations()
  904. {
  905.     register int c, k;
  906.  
  907.     cache_size = 256;
  908.     cache = MALLOC(cache_size);
  909.     if (cache == 0) no_space();
  910.  
  911.     for (;;)
  912.     {
  913.     c = nextc();
  914.     if (c == EOF) unexpected_EOF();
  915.     if (c != '%') syntax_error(lineno, line, cptr);
  916.     switch (k = keyword())
  917.     {
  918.     case MARK:
  919.         return;
  920.  
  921.     case IDENT:
  922.         copy_ident();
  923.         break;
  924.  
  925.     case TEXT:
  926.         copy_text();
  927.         break;
  928.  
  929.     case UNION:
  930.         copy_union();
  931.         break;
  932.  
  933.     case TOKEN:
  934.     case LEFT:
  935.     case RIGHT:
  936.     case NONASSOC:
  937.         declare_tokens(k);
  938.         break;
  939.  
  940.     case TYPE:
  941.         declare_types();
  942.         break;
  943.  
  944.     case START:
  945.         declare_start();
  946.         break;
  947.     }
  948.     }
  949. }
  950.  
  951. output_token_type(FILE *output_file)
  952. {
  953.   bucket * bp;
  954.   int n;
  955.  
  956.   fprintf(output_file, "datatype token =\n");
  957.   n = 0;
  958.   for (bp = first_symbol; bp; bp = bp->next) {
  959.     if (bp->class == TERM && bp->true_token) {
  960.       fprintf(output_file, "  %c %s", n == 0 ? ' ' : '|', bp->name);
  961.       if (bp->tag)
  962.         fprintf(output_file, " of %s", bp->tag);
  963.       fprintf(output_file, "\n");
  964.       n++;
  965.     }
  966.   }
  967.   fprintf(output_file, ";\n\n");
  968. }
  969.  
  970. initialize_grammar()
  971. {
  972.     nitems = 4;
  973.     maxitems = 300;
  974.     pitem = (bucket **) MALLOC(maxitems*sizeof(bucket *));
  975.     if (pitem == 0) no_space();
  976.     pitem[0] = 0;
  977.     pitem[1] = 0;
  978.     pitem[2] = 0;
  979.     pitem[3] = 0;
  980.  
  981.     nrules = 3;
  982.     maxrules = 100;
  983.     plhs = (bucket **) MALLOC(maxrules*sizeof(bucket *));
  984.     if (plhs == 0) no_space();
  985.     plhs[0] = 0;
  986.     plhs[1] = 0;
  987.     plhs[2] = 0;
  988.     rprec = (short *) MALLOC(maxrules*sizeof(short));
  989.     if (rprec == 0) no_space();
  990.     rprec[0] = 0;
  991.     rprec[1] = 0;
  992.     rprec[2] = 0;
  993.     rassoc = (char *) MALLOC(maxrules*sizeof(char));
  994.     if (rassoc == 0) no_space();
  995.     rassoc[0] = TOKEN;
  996.     rassoc[1] = TOKEN;
  997.     rassoc[2] = TOKEN;
  998. }
  999.  
  1000.  
  1001. expand_items()
  1002. {
  1003.     maxitems += 300;
  1004.     pitem = (bucket **) REALLOC(pitem, maxitems*sizeof(bucket *));
  1005.     if (pitem == 0) no_space();
  1006. }
  1007.  
  1008.  
  1009. expand_rules()
  1010. {
  1011.     maxrules += 100;
  1012.     plhs = (bucket **) REALLOC(plhs, maxrules*sizeof(bucket *));
  1013.     if (plhs == 0) no_space();
  1014.     rprec = (short *) REALLOC(rprec, maxrules*sizeof(short));
  1015.     if (rprec == 0) no_space();
  1016.     rassoc = (char *) REALLOC(rassoc, maxrules*sizeof(char));
  1017.     if (rassoc == 0) no_space();
  1018. }
  1019.  
  1020.  
  1021. advance_to_start()
  1022. {
  1023.     register int c;
  1024.     register bucket *bp;
  1025.     char *s_cptr;
  1026.     int s_lineno;
  1027.  
  1028.     for (;;)
  1029.     {
  1030.     c = nextc();
  1031.     if (c != '%') break;
  1032.     s_cptr = cptr;
  1033.     switch (keyword())
  1034.     {
  1035.     case MARK:
  1036.         no_grammar();
  1037.  
  1038.     case TEXT:
  1039.         copy_text();
  1040.         break;
  1041.  
  1042.     case START:
  1043.         declare_start();
  1044.         break;
  1045.  
  1046.     default:
  1047.         syntax_error(lineno, line, s_cptr);
  1048.     }
  1049.     }
  1050.  
  1051.     c = nextc();
  1052.     if (!isalpha(c) && c != '_' && c != '.' && c != '_')
  1053.     syntax_error(lineno, line, cptr);
  1054.     bp = get_name();
  1055.     if (goal == 0)
  1056.     {
  1057.     if (bp->class == TERM)
  1058.         terminal_start(bp->name);
  1059.     goal = bp;
  1060.     }
  1061.  
  1062.     s_lineno = lineno;
  1063.     c = nextc();
  1064.     if (c == EOF) unexpected_EOF();
  1065.     if (c != ':') syntax_error(lineno, line, cptr);
  1066.     start_rule(bp, s_lineno);
  1067.     ++cptr;
  1068. }
  1069.  
  1070.  
  1071. start_rule(bp, s_lineno)
  1072. register bucket *bp;
  1073. int s_lineno;
  1074. {
  1075.     if (bp->class == TERM)
  1076.     terminal_lhs(s_lineno);
  1077.     bp->class = NONTERM;
  1078.     if (nrules >= maxrules)
  1079.     expand_rules();
  1080.     plhs[nrules] = bp;
  1081.     rprec[nrules] = UNDEFINED;
  1082.     rassoc[nrules] = TOKEN;
  1083. }
  1084.  
  1085.  
  1086. end_rule()
  1087. {
  1088.     register int i;
  1089.  
  1090.     if (!last_was_action && plhs[nrules]->tag)
  1091.     {
  1092.     for (i = nitems - 1; pitem[i]; --i) continue;
  1093.     if (pitem[i+1] == 0 || pitem[i+1]->tag != plhs[nrules]->tag)
  1094.         default_action_warning();
  1095.     }
  1096.  
  1097.     last_was_action = 0;
  1098.     if (nitems >= maxitems) expand_items();
  1099.     pitem[nitems] = 0;
  1100.     ++nitems;
  1101.     ++nrules;
  1102. }
  1103.  
  1104.  
  1105. insert_empty_rule()
  1106. {
  1107.     register bucket *bp, **bpp;
  1108.  
  1109.     assert(cache);
  1110.     sprintf(cache, "$$%d", ++gensym);
  1111.     bp = make_bucket(cache);
  1112.     last_symbol->next = bp;
  1113.     last_symbol = bp;
  1114.     bp->tag = plhs[nrules]->tag;
  1115.     bp->class = NONTERM;
  1116.  
  1117.     if ((nitems += 2) > maxitems)
  1118.     expand_items();
  1119.     bpp = pitem + nitems - 1;
  1120.     *bpp-- = bp;
  1121.     while (bpp[0] = bpp[-1]) --bpp;
  1122.  
  1123.     if (++nrules >= maxrules)
  1124.     expand_rules();
  1125.     plhs[nrules] = plhs[nrules-1];
  1126.     plhs[nrules-1] = bp;
  1127.     rprec[nrules] = rprec[nrules-1];
  1128.     rprec[nrules-1] = 0;
  1129.     rassoc[nrules] = rassoc[nrules-1];
  1130.     rassoc[nrules-1] = TOKEN;
  1131. }
  1132.  
  1133.  
  1134. add_symbol()
  1135. {
  1136.     register int c;
  1137.     register bucket *bp;
  1138.     int s_lineno = lineno;
  1139.  
  1140.     c = *cptr;
  1141.     if (c == '\'' || c == '"')
  1142.     bp = get_literal();
  1143.     else
  1144.     bp = get_name();
  1145.  
  1146.     c = nextc();
  1147.     if (c == ':')
  1148.     {
  1149.     end_rule();
  1150.     start_rule(bp, s_lineno);
  1151.     ++cptr;
  1152.     return;
  1153.     }
  1154.  
  1155.     if (last_was_action)
  1156.     insert_empty_rule();
  1157.     last_was_action = 0;
  1158.  
  1159.     if (++nitems > maxitems)
  1160.     expand_items();
  1161.     pitem[nitems-1] = bp;
  1162. }
  1163.  
  1164.  
  1165. copy_action()
  1166. {
  1167.     register int c;
  1168.     register int i, n;
  1169.     int depth;
  1170.     int quote;
  1171.     bucket *item;
  1172.     char *tagres;
  1173.     register FILE *f = action_file;
  1174.     int a_lineno = lineno;
  1175.     char *a_line = dup_line();
  1176.     char *a_cptr = a_line + (cptr - line);
  1177.  
  1178.     if (last_was_action)
  1179.     insert_empty_rule();
  1180.     last_was_action = 1;
  1181.  
  1182.     fprintf(f, "(* Rule %d, file %s, line %d *)\n",
  1183.             nrules-2, input_file_name, lineno);
  1184.     fprintf(f, "val _= update_ yyact %d (fn () => repr((", nrules-2);
  1185.  
  1186.     n = 0;
  1187.     for (i = nitems - 1; pitem[i]; --i) ++n;
  1188.  
  1189.     depth = 1;
  1190.     cptr++;
  1191.  
  1192. loop:
  1193.     c = *cptr;
  1194.     if (c == '$')
  1195.     {
  1196.     if (isdigit(cptr[1]))
  1197.     {
  1198.         ++cptr;
  1199.         i = get_number();
  1200.  
  1201.             if (i <= 0 || i > n)
  1202.               unknown_rhs(i);
  1203.             item = pitem[nitems + i - n - 1];
  1204.             if (item->tag) {
  1205.               fprintf(f, "(peekVal %d : %s)", n - i, item->tag);
  1206.             } else {
  1207.               if (item->class == TERM)
  1208.                 { illegal_token_ref(i, item->name); }
  1209.           else
  1210.         { missing_type(item->name); }
  1211.             /* This trick, which works in Caml Light and Edinburgh ML,  
  1212.              * cannot be used in Standard ML to improve type security:
  1213.              * if (sflag)
  1214.              *    fprintf(f, "(peekVal %d)", n - i);
  1215.              * else
  1216.              *    fprintf(f, "(peekVal %d : '%s)", n - i, item->name); 
  1217.              */
  1218.             }
  1219.         goto loop;
  1220.     }
  1221.     }
  1222.     if (isalpha(c) || c == '_' || c == '$')
  1223.     {
  1224.     do
  1225.     {
  1226.         putc(c, f);
  1227.         c = *++cptr;
  1228.     } while (isalnum(c) || c == '_' || c == '$');
  1229.     goto loop;
  1230.     }
  1231.     if (c == '}' && depth == 1) {
  1232.       cptr++;
  1233.       tagres = plhs[nrules]->tag;
  1234.       if (tagres)
  1235.         { fprintf(f, ") : %s))\n", tagres); }
  1236.       else         
  1237.     { missing_type(plhs[nrules]->name); }
  1238.       /* Same problem as above: don't insert type ascriptions:
  1239.        * if (sflag)
  1240.        *  fprintf(f, ")))\n");
  1241.        * else
  1242.        *  fprintf(f, ") : '%s))\n", plhs[nrules]->name);
  1243.        */
  1244.       /* if (sflag) */
  1245.         fprintf(f, ";\n");
  1246.       return;
  1247.     }
  1248.     putc(c, f);
  1249.     ++cptr;
  1250.     switch (c)
  1251.     {
  1252.     case '\n':
  1253.     next_line:
  1254.     get_line();
  1255.     if (line) goto loop;
  1256.     unterminated_action(a_lineno, a_line, a_cptr);
  1257.  
  1258.     case '{':
  1259.     ++depth;
  1260.     goto loop;
  1261.  
  1262.     case '}':
  1263.     --depth;
  1264.         goto loop;
  1265.  
  1266.     case '`':
  1267.     case '"':
  1268.     {
  1269.         int s_lineno = lineno;
  1270.         char *s_line = dup_line();
  1271.         char *s_cptr = s_line + (cptr - line - 1);
  1272.  
  1273.         quote = c;
  1274.         for (;;)
  1275.         {
  1276.         c = *cptr++;
  1277.         putc(c, f);
  1278.         if (c == quote)
  1279.         {
  1280.             FREE(s_line);
  1281.             goto loop;
  1282.         }
  1283.         if (c == '\n')
  1284.             unterminated_string(s_lineno, s_line, s_cptr);
  1285.         if (c == '\\')
  1286.         {
  1287.             c = *cptr++;
  1288.             putc(c, f);
  1289.             if (c == '\n')
  1290.             {
  1291.             get_line();
  1292.             if (line == 0)
  1293.                 unterminated_string(s_lineno, s_line, s_cptr);
  1294.             }
  1295.         }
  1296.         }
  1297.     }
  1298.  
  1299.     case '(':
  1300.     c = *cptr;
  1301.     if (c == '*')
  1302.     {
  1303.         int c_lineno = lineno;
  1304.         char *c_line = dup_line();
  1305.         char *c_cptr = c_line + (cptr - line - 1);
  1306.  
  1307.         putc('*', f);
  1308.         ++cptr;
  1309.         for (;;)
  1310.         {
  1311.         c = *cptr++;
  1312.         putc(c, f);
  1313.         if (c == '*' && *cptr == ')')
  1314.         {
  1315.             putc(')', f);
  1316.             ++cptr;
  1317.             FREE(c_line);
  1318.             goto loop;
  1319.         }
  1320.         if (c == '\n')
  1321.         {
  1322.             get_line();
  1323.             if (line == 0)
  1324.             unterminated_comment(c_lineno, c_line, c_cptr);
  1325.         }
  1326.         }
  1327.     }
  1328.     goto loop;
  1329.  
  1330.     default:
  1331.     goto loop;
  1332.     }
  1333. }
  1334.  
  1335.  
  1336. int
  1337. mark_symbol()
  1338. {
  1339.     register int c;
  1340.     register bucket *bp;
  1341.  
  1342.     c = cptr[1];
  1343.     if (c == '%' || c == '\\')
  1344.     {
  1345.     cptr += 2;
  1346.     return (1);
  1347.     }
  1348.  
  1349.     if (c == '=')
  1350.     cptr += 2;
  1351.     else if ((c == 'p' || c == 'P') &&
  1352.          ((c = cptr[2]) == 'r' || c == 'R') &&
  1353.          ((c = cptr[3]) == 'e' || c == 'E') &&
  1354.          ((c = cptr[4]) == 'c' || c == 'C') &&
  1355.          ((c = cptr[5], !IS_IDENT(c))))
  1356.     cptr += 5;
  1357.     else
  1358.     syntax_error(lineno, line, cptr);
  1359.  
  1360.     c = nextc();
  1361.     if (isalpha(c) || c == '_' || c == '.' || c == '$')
  1362.     bp = get_name();
  1363.     else if (c == '\'' || c == '"')
  1364.     bp = get_literal();
  1365.     else
  1366.     {
  1367.     syntax_error(lineno, line, cptr);
  1368.     /*NOTREACHED*/
  1369.     }
  1370.  
  1371.     if (rprec[nrules] != UNDEFINED && bp->prec != rprec[nrules])
  1372.     prec_redeclared();
  1373.  
  1374.     rprec[nrules] = bp->prec;
  1375.     rassoc[nrules] = bp->assoc;
  1376.     return (0);
  1377. }
  1378.  
  1379.  
  1380. read_grammar()
  1381. {
  1382.     register int c;
  1383.  
  1384.     initialize_grammar();
  1385.     advance_to_start();
  1386.  
  1387.     for (;;)
  1388.     {
  1389.     c = nextc();
  1390.     if (c == EOF) break;
  1391.     if (isalpha(c) || c == '_' || c == '.' || c == '$' || c == '\'' ||
  1392.         c == '"')
  1393.         add_symbol();
  1394.     else if (c == '{' || c == '=')
  1395.         copy_action();
  1396.     else if (c == '|')
  1397.     {
  1398.         end_rule();
  1399.         start_rule(plhs[nrules-1], 0);
  1400.         ++cptr;
  1401.     }
  1402.     else if (c == '%')
  1403.     {
  1404.         if (mark_symbol()) break;
  1405.     }
  1406.     else
  1407.         syntax_error(lineno, line, cptr);
  1408.     }
  1409.     end_rule();
  1410. }
  1411.  
  1412.  
  1413. free_tags()
  1414. {
  1415.     register int i;
  1416.  
  1417.     if (tag_table == 0) return;
  1418.  
  1419.     for (i = 0; i < ntags; ++i)
  1420.     {
  1421.     assert(tag_table[i]);
  1422.     FREE(tag_table[i]);
  1423.     }
  1424.     FREE(tag_table);
  1425. }
  1426.  
  1427.  
  1428. pack_names()
  1429. {
  1430.     register bucket *bp;
  1431.     register char *p, *s, *t;
  1432.  
  1433.     name_pool_size = 13;  /* 13 == sizeof("$end") + sizeof("$accept") */
  1434.     for (bp = first_symbol; bp; bp = bp->next)
  1435.     name_pool_size += strlen(bp->name) + 1;
  1436.     name_pool = MALLOC(name_pool_size);
  1437.     if (name_pool == 0) no_space();
  1438.  
  1439.     strcpy(name_pool, "$accept");
  1440.     strcpy(name_pool+8, "$end");
  1441.     t = name_pool + 13;
  1442.     for (bp = first_symbol; bp; bp = bp->next)
  1443.     {
  1444.     p = t;
  1445.     s = bp->name;
  1446.     while (*t++ = *s++) continue;
  1447.     FREE(bp->name);
  1448.     bp->name = p;
  1449.     }
  1450. }
  1451.  
  1452.  
  1453. check_symbols()
  1454. {
  1455.     register bucket *bp;
  1456.  
  1457.     if (goal->class == UNKNOWN)
  1458.     undefined_goal(goal->name);
  1459.  
  1460.     for (bp = first_symbol; bp; bp = bp->next)
  1461.     {
  1462.     if (bp->class == UNKNOWN)
  1463.     {
  1464.         undefined_symbol_warning(bp->name);
  1465.         bp->class = TERM;
  1466.     }
  1467.     }
  1468. }
  1469.  
  1470.  
  1471. pack_symbols()
  1472. {
  1473.     register bucket *bp;
  1474.     register bucket **v;
  1475.     register int i, j, k, n;
  1476.  
  1477.     nsyms = 2;
  1478.     ntokens = 1;
  1479.     for (bp = first_symbol; bp; bp = bp->next)
  1480.     {
  1481.     ++nsyms;
  1482.     if (bp->class == TERM) ++ntokens;
  1483.     }
  1484.     start_symbol = ntokens;
  1485.     nvars = nsyms - ntokens;
  1486.  
  1487.     symbol_name = (char **) MALLOC(nsyms*sizeof(char *));
  1488.     if (symbol_name == 0) no_space();
  1489.     symbol_value = (short *) MALLOC(nsyms*sizeof(short));
  1490.     if (symbol_value == 0) no_space();
  1491.     symbol_prec = (short *) MALLOC(nsyms*sizeof(short));
  1492.     if (symbol_prec == 0) no_space();
  1493.     symbol_assoc = MALLOC(nsyms);
  1494.     if (symbol_assoc == 0) no_space();
  1495.     symbol_tag = (char **) MALLOC(nsyms*sizeof(char *));
  1496.     if (symbol_tag == 0) no_space();
  1497.     symbol_true_token = (char *) MALLOC(nsyms*sizeof(char));
  1498.     if (symbol_true_token == 0) no_space();
  1499.  
  1500.     v = (bucket **) MALLOC(nsyms*sizeof(bucket *));
  1501.     if (v == 0) no_space();
  1502.  
  1503.     v[0] = 0;
  1504.     v[start_symbol] = 0;
  1505.  
  1506.     i = 1;
  1507.     j = start_symbol + 1;
  1508.     for (bp = first_symbol; bp; bp = bp->next)
  1509.     {
  1510.     if (bp->class == TERM)
  1511.         v[i++] = bp;
  1512.     else
  1513.         v[j++] = bp;
  1514.     }
  1515.     assert(i == ntokens && j == nsyms);
  1516.  
  1517.     for (i = 1; i < ntokens; ++i)
  1518.     v[i]->index = i;
  1519.  
  1520.     goal->index = start_symbol + 1;
  1521.     k = start_symbol + 2;
  1522.     while (++i < nsyms)
  1523.     if (v[i] != goal)
  1524.     {
  1525.         v[i]->index = k;
  1526.         ++k;
  1527.     }
  1528.  
  1529.     goal->value = 0;
  1530.     k = 1;
  1531.     for (i = start_symbol + 1; i < nsyms; ++i)
  1532.     {
  1533.     if (v[i] != goal)
  1534.     {
  1535.         v[i]->value = k;
  1536.         ++k;
  1537.     }
  1538.     }
  1539.  
  1540.     k = 0;
  1541.     for (i = 1; i < ntokens; ++i)
  1542.     {
  1543.     n = v[i]->value;
  1544.     if (n > 256)
  1545.     {
  1546.         for (j = k++; j > 0 && symbol_value[j-1] > n; --j)
  1547.         symbol_value[j] = symbol_value[j-1];
  1548.         symbol_value[j] = n;
  1549.     }
  1550.     }
  1551.  
  1552.     if (v[1]->value == UNDEFINED)
  1553.     v[1]->value = 256;
  1554.  
  1555.     j = 0;
  1556.     n = 257;
  1557.     for (i = 2; i < ntokens; ++i)
  1558.     {
  1559.     if (v[i]->value == UNDEFINED)
  1560.     {
  1561.         while (j < k && n == symbol_value[j])
  1562.         {
  1563.         while (++j < k && n == symbol_value[j]) continue;
  1564.         ++n;
  1565.         }
  1566.         v[i]->value = n;
  1567.         ++n;
  1568.     }
  1569.     }
  1570.  
  1571.     symbol_name[0] = name_pool + 8;
  1572.     symbol_value[0] = 0;
  1573.     symbol_prec[0] = 0;
  1574.     symbol_assoc[0] = TOKEN;
  1575.     symbol_tag[0] = "";
  1576.     symbol_true_token[0] = 0;
  1577.     for (i = 1; i < ntokens; ++i)
  1578.     {
  1579.     symbol_name[i] = v[i]->name;
  1580.     symbol_value[i] = v[i]->value;
  1581.     symbol_prec[i] = v[i]->prec;
  1582.     symbol_assoc[i] = v[i]->assoc;
  1583.     symbol_tag[i] = v[i]->tag;
  1584.     symbol_true_token[i] = v[i]->true_token;
  1585.     }
  1586.     symbol_name[start_symbol] = name_pool;
  1587.     symbol_value[start_symbol] = -1;
  1588.     symbol_prec[start_symbol] = 0;
  1589.     symbol_assoc[start_symbol] = TOKEN;
  1590.     symbol_tag[start_symbol] = "";
  1591.     symbol_true_token[start_symbol] = 0;
  1592.     for (++i; i < nsyms; ++i)
  1593.     {
  1594.     k = v[i]->index;
  1595.     symbol_name[k] = v[i]->name;
  1596.     symbol_value[k] = v[i]->value;
  1597.     symbol_prec[k] = v[i]->prec;
  1598.     symbol_assoc[k] = v[i]->assoc;
  1599.     symbol_tag[i] = v[i]->tag;
  1600.     symbol_true_token[i] = v[i]->true_token;
  1601.     }
  1602.  
  1603.     FREE(v);
  1604. }
  1605.  
  1606.  
  1607. make_goal()
  1608. {
  1609.   static char name[7] = "'\\xxx'";
  1610.   bucket * bp;
  1611.   bucket * bc;
  1612.  
  1613.   goal = lookup("%entry%");
  1614.   ntotalrules = nrules - 2;
  1615.   for(bp = first_symbol; bp != 0; bp = bp->next) {
  1616.     if (bp->entry) {
  1617.       start_rule(goal, 0);
  1618.       if (nitems + 2> maxitems)
  1619.     expand_items();
  1620.       name[2] = '0' + ((bp->entry >> 6) & 7);
  1621.       name[3] = '0' + ((bp->entry >> 3) & 7);
  1622.       name[4] = '0' + (bp->entry & 7);
  1623.       bc = lookup(name);
  1624.       bc->class = TERM;
  1625.       bc->value = (unsigned char) bp->entry;
  1626.       pitem[nitems++] = bc;
  1627.       pitem[nitems++] = bp;
  1628.       fprintf(entry_file,
  1629.               "val %s = yyparse yytables %d;\n",
  1630.               bp->name, bp->entry);
  1631.       fprintf(interface_file,
  1632.               "val %s :\n  (Lexing.lexbuf -> token) -> Lexing.lexbuf -> %s;\n",
  1633.               bp->name,
  1634.               bp->tag);
  1635.       fprintf(action_file,
  1636.               "(* Entry %s *)\n", bp->name);
  1637.       fprintf(action_file,
  1638.        "val _ = update_ yyact %d (fn () => raise yyexit (peekVal 0));\n",
  1639.        ntotalrules);
  1640.       ntotalrules++;
  1641.       last_was_action = 1;
  1642.       end_rule();
  1643.     }
  1644.   }
  1645. }
  1646.  
  1647. pack_grammar()
  1648. {
  1649.     register int i, j;
  1650.     int assoc, prec;
  1651.  
  1652.     ritem = (short *) MALLOC(nitems*sizeof(short));
  1653.     if (ritem == 0) no_space();
  1654.     rlhs = (short *) MALLOC(nrules*sizeof(short));
  1655.     if (rlhs == 0) no_space();
  1656.     rrhs = (short *) MALLOC((nrules+1)*sizeof(short));
  1657.     if (rrhs == 0) no_space();
  1658.     rprec = (short *) REALLOC(rprec, nrules*sizeof(short));
  1659.     if (rprec == 0) no_space();
  1660.     rassoc = REALLOC(rassoc, nrules);
  1661.     if (rassoc == 0) no_space();
  1662.  
  1663.     ritem[0] = -1;
  1664.     ritem[1] = goal->index;
  1665.     ritem[2] = 0;
  1666.     ritem[3] = -2;
  1667.     rlhs[0] = 0;
  1668.     rlhs[1] = 0;
  1669.     rlhs[2] = start_symbol;
  1670.     rrhs[0] = 0;
  1671.     rrhs[1] = 0;
  1672.     rrhs[2] = 1;
  1673.  
  1674.     j = 4;
  1675.     for (i = 3; i < nrules; ++i)
  1676.     {
  1677.     rlhs[i] = plhs[i]->index;
  1678.     rrhs[i] = j;
  1679.     assoc = TOKEN;
  1680.     prec = 0;
  1681.     while (pitem[j])
  1682.     {
  1683.         ritem[j] = pitem[j]->index;
  1684.         if (pitem[j]->class == TERM)
  1685.         {
  1686.         prec = pitem[j]->prec;
  1687.         assoc = pitem[j]->assoc;
  1688.         }
  1689.         ++j;
  1690.     }
  1691.     ritem[j] = -i;
  1692.     ++j;
  1693.     if (rprec[i] == UNDEFINED)
  1694.     {
  1695.         rprec[i] = prec;
  1696.         rassoc[i] = assoc;
  1697.     }
  1698.     }
  1699.     rrhs[i] = j;
  1700.  
  1701.     FREE(plhs);
  1702.     FREE(pitem);
  1703. }
  1704.  
  1705.  
  1706. print_grammar()
  1707. {
  1708.     register int i, j, k;
  1709.     int spacing;
  1710.     register FILE *f = verbose_file;
  1711.  
  1712.     if (!vflag) return;
  1713.  
  1714.     k = 1;
  1715.     for (i = 2; i < nrules; ++i)
  1716.     {
  1717.     if (rlhs[i] != rlhs[i-1])
  1718.     {
  1719.         if (i != 2) fprintf(f, "\n");
  1720.         fprintf(f, "%4d  %s :", i - 2, symbol_name[rlhs[i]]);
  1721.         spacing = strlen(symbol_name[rlhs[i]]) + 1;
  1722.     }
  1723.     else
  1724.     {
  1725.         fprintf(f, "%4d  ", i - 2);
  1726.         j = spacing;
  1727.         while (--j >= 0) putc(' ', f);
  1728.         putc('|', f);
  1729.     }
  1730.  
  1731.     while (ritem[k] >= 0)
  1732.     {
  1733.         fprintf(f, " %s", symbol_name[ritem[k]]);
  1734.         ++k;
  1735.     }
  1736.     ++k;
  1737.     putc('\n', f);
  1738.     }
  1739. }
  1740.  
  1741.  
  1742. reader()
  1743. {
  1744.     create_symbol_table();
  1745.     read_declarations();
  1746.     output_token_type(interface_file);
  1747.     output_token_type(code_file);
  1748.     read_grammar();
  1749.     make_goal();
  1750.     free_symbol_table();
  1751.     free_tags();
  1752.     pack_names();
  1753.     check_symbols();
  1754.     pack_symbols();
  1755.     pack_grammar();
  1756.     free_symbols();
  1757.     print_grammar();
  1758. }
  1759.